Loading...
机构名称:
¥ 2.0

在图像生成的领域中,从视觉提示中创建自定义的图像,并以其他文本指令的形式出现作为有希望的努力。然而,除去基于调整和不含调整的方法,与解释视觉提示的主题属性的斗争。这会导致主题 - 略带属性渗透到生成过程,最终损害了编辑性和ID保存中的人性化质量。在本文中,我们提出了Disenvisioner,这是一种新颖的方法,用于在过滤出irrelevant信息的同时有效地提取和丰富主题的特征,以无调的方式启用出色的自定义性能,并且仅使用单个图像。具体来说,该主题和其他无关组件的特征被有效地分为独特的视觉令牌,从而实现了更准确的自定义。,为了进一步提高ID的一致性,我们丰富了分离的特征,将它们雕刻成更精细的代表。实验证明了我们的方法优于教学响应(编辑性),ID一致性,推理速度和整体图像质量中现有方法的优越性,从而突出了贬低者的有效性和效率。项目页面:disenvisioner.github.io。

arxiv:2410.02067v2 [CS.CV] 2024年10月28日

arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第1页

arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第2页

arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第3页

arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第4页

arxiv:2410.02067v2 [CS.CV] 2024年10月28日PDF文件第5页

相关文件推荐

2024 年
¥1.0
2024 年
¥1.0
2020 年
¥1.0